home *** CD-ROM | disk | FTP | other *** search
/ The World of Computer Software / The World of Computer Software.iso / ts1st20.zip / STATMEAS.INF < prev    next >
Text File  |  1992-09-22  |  15KB  |  378 lines

  1.                            - 1 -
  2. Tue 22-September-1992                          (All rights reserved)
  3.  
  4. About TS1ST in General  (Statistical univariate measures)
  5. ======================
  6.  
  7. Apply question mark ? with the program call for a brief description
  8. of a program.
  9.  
  10. This package may be used and distributed freely for NON-COMMERCIAL,
  11. NON-INSTITUTIONAL, PRIVATE purposes, provided it is not changed in
  12. any way.
  13. ┌────────────────────────────────────────────────────────────────┐
  14. │ For ANY other usage (such as use in a business enterprise or a │
  15. │ university) or the full scale version contact the author for a │
  16. │ personal or a site license.                                    │
  17. └────────────────────────────────────────────────────────────────┘
  18. Please do not distribute any part of this package separately.
  19. Uploading to BBSes is encouraged.
  20.  
  21. The registered version is strictly for the registrant only.
  22. Identical programs must NOT be running on more than one computer at
  23. a time. Site licensed programs must not be run outside the licensed
  24. site.
  25.  
  26. The programs are under development. Comments and contacts are
  27. solicited. If you have any questions, please do not hesitate to use
  28. electronic mail for communication.
  29. InterNet address: ts@uwasa.fi         (preferred)
  30. Bitnet address:   SALMI@FINFUN
  31.  
  32. The author shall not be liable to the user for any direct, indirect
  33. or consequential loss arising from the use of, or inability to use,
  34. any program or file howsoever caused. No warranty is given that the
  35. programs will work under all circumstances.
  36.  
  37. Timo Salmi
  38. Professor of Accounting and Business Finance
  39. Faculty of Accounting and Industrial Management
  40. University of Vaasa
  41. P.O. BOX 297, SF-65101 Vaasa, Finland
  42.  
  43. CONTENTS:
  44.  
  45.   1. Acknowledgments
  46.   2. General Description
  47.   3. Formulae
  48.   4. The Other Statistical Programs in the Set
  49.   5. The Statistics Set for Other Computers
  50.   6. Release Notes for Statmeas
  51.   7. List of the files in the package
  52.  
  53.                            - 2 -
  54.  
  55.  
  56. 1. ACKNOWLEDGEMENTS
  57.  
  58.    Useful help by the following colleagues in testing STATMEAS and
  59. discussing the statistical concepts is gratefully acknowledged:
  60. Associate Professor Martti Luoma, Lecturer Antti Kanto, and
  61. Assistant Markku Malkamäki.
  62.  
  63.  
  64. 2. GENERAL DESCRIPTION
  65.  
  66. STATMEAS (Ver 2.0)
  67.  
  68.    STATistical MEASures program is part of the interactive
  69. statistical system by Timo Salmi. It is the first program in the
  70. set, and is intended for univariate statistical analysis. (For the
  71. other programs in the set see Chapter 4.)
  72.  
  73.    STAMEAS includes a built-in help system, which can be invoked by
  74. typing ? at any interactive question. Because of this built-in help,
  75. and the interactive nature of the program's user interface, no
  76. long-winding instructions have been included. (Who reads
  77. instructions anyhow?)
  78.  
  79.    The program calculates for a set of observations in accordance
  80. with the user's choice:
  81.        1) Standard statistical measures
  82.        2) Autocorrelations
  83.        3) Runs
  84. and
  85.        4) Draws frequency diagrams.
  86.   The data can either be given from the keyboard or taken from a
  87. file. If the input is to be taken from a file it must first be
  88. prepared with some editor, or some word processor which includes an
  89. option for preparing ordinary ascii text.
  90.  
  91.    The data is given to the program in the following format:
  92.  
  93.        X1 X2 X3               !variable names (! denotes a comment)
  94.        3.56 6.32 -1.73
  95.        5.12 -4.21 9.18
  96.        14.2 5.11 0.31
  97.        END                    !END is optional in a file
  98.  
  99. A missing item in an observation is marked by a hash (#). E.g. if
  100. the first item of the second observation were missing, the
  101. observation should be written as  # -4.21 9.18
  102.  
  103.    The items in an observation can be separated with blanks, as in
  104. the above, or with commas (,) e.g. 5.12,-4.21,9.18. The number of
  105. the intervening blanks is irrelevant, and can be customized for
  106. increased readability.
  107. Thus e.g. 5.12 -4.21 9.18
  108. and      5.12    -4.21     9.18
  109. are equivalent.
  110.  
  111.    A row can be continued using an ampersand (&). E.g. the variables
  112. could be given as
  113.        X1 X2 &
  114.        X3
  115. Alternatively, * can be used instead of & as the continuation
  116. marker.
  117.  
  118.    Comments can be added to the input data. If ! appears on a line
  119. all text after ! will be considered as a comment.
  120.  
  121.    A header can be entered on each page if output is directed to a
  122. file. To accomplish this start the very first line on the input file
  123. with a double exclamation mark (!!) and the rest of the line will be
  124. used as the header. Thus !! indicates a header, a single ! an
  125. ordinary comment.
  126.  
  127.    The maximum number of variables is 25. The maximum number of
  128. observations is 400 (for each variable). The public domain version,
  129. however, sets the limits at 4 and 100 respectively.
  130.  
  131.  
  132. 3. FORMULAE
  133.  
  134.    This chapter gives a selected summary of the univariate
  135. statistics formulas used in STATMEAS.
  136.  
  137.    Denote
  138.     N    = number of observations (of the relevant variable)
  139.     x(j) = value of the j'th observation (for the relevant variable)
  140.  
  141. Mean  kx = Σ x(j) / N
  142.  
  143.                          ____________________
  144. Standard deviation  s = √ Σ (x(j)-kx)²/ (N-1)
  145.  
  146.  
  147. Variance  s² = Σ (x(j)-kx)²/ (N-1)
  148.  
  149.  
  150. Coefficient of variation = standard deviation / mean
  151.  
  152.                             3     3                           ½
  153. Skewness  g(1) = Σ (x(j)-kx) / (Ns )      standard error (6/N)
  154.  
  155.  
  156.                                   4                            ½
  157. Kurtosis  g(2) = Σ (x(j)-kx) / (Ns ) - 3  standard error (24/N)
  158.  
  159.  
  160.                          N-lag
  161.                           Σ   (x(j+lag)-kx)(x(j)-kx)
  162.                          j=1
  163. Autocorrelation r(lag) = ----------------------------
  164.                                 N
  165.                                 Σ  (x(j)-kx)²
  166.                                j=1
  167.  
  168.                              _______________________
  169.                              │      lag-1
  170. Standard error std(r(lag)) = │ (1 +   Σ 2 r(i)²) / N
  171.                              √       i=1
  172.  
  173.  
  174. t-value = r(lag) / std(r(lag))
  175.  
  176.  
  177.                      lag
  178. Ljung-Box Q = N(N+2)  Σ  r(i)² / (N - i)
  179.                      i=1
  180.  
  181. Run statistics:
  182.  
  183. Denote n1 = number of negative changes
  184.        n2 = number of no changes
  185.        n3 = number of positive changes
  186.        n4 = n1 + n2 + n3
  187.  
  188.  
  189. expected number of runs = (n4(n4+1) - n1² - n2² - n3²) / N
  190.  
  191.                        number of runs - expected number of runs + 0.5
  192. Standardized k-value = ----------------------------------------------
  193.                                 std deviation of runs
  194.  
  195.  
  196. 4. THE OTHER STATISTICAL PROGRAMS IN THE SET
  197.  
  198.    STATMEAS is the first statistical program in a set of programs
  199. intended for analyzing statistical data. The second program in the
  200. set is STATREGR (STATistics: multiple REGRession), which also has
  201. been released. Plans include STATTRAN (STATistics TRANsformations)
  202. for effecting transformations (such as logarithms, differences,
  203. roots, etc.) on the data, and STATRCOR (STATistic Ranks and
  204. CORrelations) which is intended for parametric and non-parametric
  205. correlation analysis.
  206.    STATTRAN, STATRCOR, and STATLADR have now been released to
  207. complete the set. Each of the programs appears in a different .zip
  208. file. The names are:
  209. TS1STxx.ZIP <-- STATMEAS
  210. TS2STxx.ZIP <-- STATREGR
  211. TS3STxx.ZIP <-- STATTRAN
  212. TS4STxx.ZIP <-- STATRCOR
  213. TS5STxx.ZIP <-- STATLADR
  214.  
  215.  
  216. 5. THE STATISTICS SET FOR OTHER COMPUTERS
  217.  
  218.    The Statistical programs by Timo Salmi are (were) also available
  219. for ill-fated the Sinclair QL computer. Named STATPREP the system is
  220. part of a Public Domain library for QUANTA members. The descriptions
  221. of the files in the Quanta Library are given below as taken directly
  222. from a QL database.
  223.    The central part of the package has also been programmed for the
  224. VAX/VMS by the author, but he input and output commands of the VAX
  225. "REGRE" and "LADRE" programs are in Finnish, and the VAX versions
  226. are not public domain. (LADRE is a Least Absolute Deviation multiple
  227. REgression analysis.)
  228.  
  229. In Quanta Library:
  230.  
  231. STATPREP_DOC
  232. Quill   documentation  of  Timo  Salmi's  statistical  package.
  233. Associated  programs STATPREP_EXE,  STATTRAN_EXE, STATMEAS_EXE,
  234. STATRCOR_EXE, STATREGR_EXE, STATDIAG_EXE, and STATMENU.
  235.  
  236. STATMENU
  237. Besides EXEC_W'ing the statistical  package  programs  you  can
  238. LRUN STATMENU  and let  it take  care of  the calls.  Makes the
  239. package still  easier  to  use.  Alter  the  default  device(s)
  240. (FDK1_) for your own configuration, if necessary.
  241.  
  242. STATPREP_EXE (statistics preparation editor)
  243. An editor of  a  kind  used  for  entering  the  data  for  the
  244. associated  statistical programs. Maximum 10 variables with 200
  245. observations (each).
  246.  
  247. STATTRAN_EXE (transformations on variables)
  248. Used for  making transformations on  observations prepared with
  249. STATPREP_EXE.  Transformations   include   taking   logarithms,
  250. raising  to  power,  taking  roots,  scaling,  and  multiplying
  251. between observations. Takes  its input  from a  <statprep> file
  252. prepared by STATPREP_EXE and creates a new <statprep> file with
  253. the original and the transformed variables.
  254.  
  255. STATMEAS_EXE (statistical measures)
  256. Standard  statistical measures and frequency diagram for any of
  257. the  variables in the data.  Measures include minimum, maximum,
  258. mean, median, standard deviation, variance and kurtosis.
  259.  
  260. STATRCOR_EXE (ranks and correlations)
  261. Calculates  both the usual (Pearson's) correlation coefficients
  262. and Spearman's  rank correlation  coefficients. Also  gives, on
  263. request,  ranks for the  observations of any  of the variables.
  264. Note that  computing Spearman's  rank correlations  takes quite
  265. awhile.
  266.  
  267. STATAURU_EXE (autocorrelations and runs)
  268. Calculates   autocorrelations  up  to  the  desired  lag.  Also
  269. calculates runs statistics.
  270.  
  271. STATREGR_EXE (multiple regression)
  272. Full-scale multivariate  regression on  the data  prepared with
  273. STATPREP_EXE (and STATTRAN_EXE).
  274.  
  275. STATDIAG_EXE (scatter diagram)
  276. Draws  scatter diagrams of the  data prepared with STATPREP_EXE
  277. (and  STATTRAN_EXE). The user has the  choice of the X-axis and
  278. the Y-axis. If the user specifies a regression model (estimated
  279. by  STATREGR_EXE), the predicted (i.e. regressed) values can be
  280. plotted  on the scatter diagram. Furthermore, a scatter diagram
  281. of the residual  can be drawn  against any of  the variables if
  282. the user has specified the regression model.
  283.  
  284.  
  285. 6. RELEASE NOTES FOR STATMEAS
  286.  
  287.    Versions 1.1 and 1.2 of STATMEAS include some minor changes and
  288. corrections in the user interface to make it fully compatible with
  289. the other programs in the set.
  290.  
  291.    Version 1.3:  If the input file is not found, you have the choice
  292. of listing directories from within STATREGR. The directory routine
  293. has been rewritten for a more relaxed syntax. (For details see the
  294. information on DIRW in TSUTIL.INF in TSUTILxx.ZIP version 1.8 or
  295. later.)
  296.  
  297.    Version 1.4:  An attempt to rewrite a protected file no longer
  298. crashes the program.
  299.  
  300.    Version 1.5:  This version introduces input recall and line
  301. editing. The special keys Del, CrLf, CrRg, CrUp, Home, End, and Esc
  302. are functional for this purpose. PgUp is the recall key. Line
  303. editing uses insert mode.
  304.  Disk access has been made faster (the program has its own cache).
  305.  The directory routine has been updated.
  306.  Read-only files can be read properly.
  307.  
  308.    Version 1.6: While fixing a bug in the multiple regression
  309. program I also made some enhancements in the routines which are
  310. common to all my statistical programs. Most importantly the insert
  311. key has been made functional in the line editing.
  312.  
  313.    Version 1.7: The line editing potential of the program has been
  314. improved. When the task is given from the keyboard, and continuation
  315. lines are used, the repeated input recall (CursorUp) gets each line
  316. in turn. Ctlr-C and break-key abort have been enhanced.
  317.  A line can be continued using an &, or a * at the end. Now also the
  318. backslash \ is accepted.  This was suggested by Tuomas Eerola.
  319.  Some help texts within the program have been extended.
  320.  
  321.    Version 1.8: Several improvements to the nuts and bolts of the
  322. user interface.
  323.    The new usage of the call is
  324. PROGNAME [/h(elp)] [/iInputFileName] [/oOutputFileName] [/cColumnsPerRow]
  325. (the /c option, which regulates the width of the output, is for
  326. registered versions, only). If you use the /i switch, it stuffs the
  327. InputFileName into the appropriate recall buffer. This means that
  328. when the program asks you for the input file name, you can invoke
  329. the input file name just by pressing the CursorUp key. (The same
  330. goes for the /o switch, respectively.) This is very convenient, if
  331. you use the program many times successively making small changes in
  332. your data in between. (This assumes, of course, that you have a
  333. command line editor like DOSEDIT or CED to recall previous MsDos
  334. commands. These common shareware programs can be obtained from any
  335. well-stocked BBS or FTP site.)
  336.    The printer readiness test has been rewritten to be more general.
  337. The earlier test failed for some printers, because the codes the
  338. printers send when they are offline are not standardized.
  339.    The "file exists, overwrite?" question is no more asked when the
  340. output file is prn, in other words when the output is directed to
  341. the printer.
  342.    The user has now a choice of a left margin from 0 to 20 blanks
  343. when output is directed to the printer.
  344.    The user has now a choice between formfeed and four blank lines
  345. to start each new page of output.
  346.    When an input file is not found, the user is given the choice of
  347. listing a directory. The directory routine has been rewritten.
  348.    The file ready message now also includes the file side besides
  349. the name.
  350.  
  351.    Version 1.9: The calculation of the coefficient of variation was
  352. added.
  353.  
  354.    Version 2.0: The input and output file names can be optionally
  355. given as parameters in the program calls, e.g.
  356.       STATMEAS /ic:\stat\test.dat /or:\tmp
  357. This option has  been improved.  The "prefilled"  name (e.g.
  358. c:\stat\test.dat) will now automatically appear on the input line
  359. without the need of pressing the cursor up key. All you need to do
  360. is to press enter.
  361.    Also made some minor internal changes not worth recording.
  362.    Rewrote the document files using a 68 column wrap instead of the
  363. former 80 to make the text easier to read and handle. Added the list
  364. of files in the package to the documentation.
  365.  
  366. 7. LIST OF THE FILES IN THE PACKAGE
  367.  
  368. TS1ST Statistics by T.Salmi, Part I
  369. Filename        Comment
  370. --------        --------------------------------
  371. FILE_ID.DIZ     Brief characterization of TS1ST
  372. STATMEAS.EXE    Statistical univariate measures
  373. STATMEAS.INF    Document
  374. TSPROG.INF      List of PD programs from T.Salmi
  375. VAASA.INF       Info: Finland, Vaasa, U of Vaasa
  376. ----            ------             ------  -----
  377. 0005
  378.